تشخیص گوینده در محیط شامل چند گوینده با استفاده از ماشین بردار پشتیبان
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود
- نویسنده مرضیه لشکربلوکی
- استاد راهنما حسین مروی
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1390
چکیده
شناسایی گوینده یکی از مباحث مطرح در بحث پردازش گفتار می باشد. شناسایی گوینده عبارت است از فرآیندی که طی آن با استفاده از سیگنال صحبت تشخیص دهیم چه کسی چه موقع واقعا صحبت می کند. هدف طراحی سیستمی است که بتواند تغییر در گوینده را مشخص نماید و گفتار هرگوینده را برای سیستم برچسب گذاری نماید. یعنی مشخص نماید که کدام گوینده، در چه بازه هایی صحبت کرده است. امروزه این عمل با یک عنوان جدید که هر دو فرآیند جداسازی و برچسب گذاری را در بر می گیرد بنام speaker diarization مشهور گشته است. هدف از بخش بندی تقسیم سیگنال گفتاری به بخش هایی است که تنها شامل گفتار یک گوینده هستند و هدف از خوشه بندی نیز شناسایی بخش های گفتاری مربوط به یک گوینده و اختصاص یک برچسب واحد به آنهاست. هدف از انجام این پایان نامه طراحی و پیاده سازی یک سیستم بخش بندی و خوشه بندی گوینده با استفاده از الگوریتم های جدید و همچنین بهبود نتایج این الگوریتم ها برای این موضوع می باشد. این سیستم باید بطور صحیح نقاط تغییر گوینده را بدون دانستن اطلاعات قبلی از گوینده تشخیص داده و در نهایت تمام قسمت های صوتی مربوط به یک گوینده را در یک خوشه قرار می دهد. در این پایان نامه، سیستم تشخیص گوینده، از سه مرحله اصلی تشکیل شده است. درمرحله اول قسمت- های غیر گفتاری، از بخش های گفتاری فایل صوتی حذف می شوند، تا دقت و سرعت عملیات سیستم در مراحل بعدی افزایش پیدا کند. سپس فایل گفتاری به بخش هایی همگن که در آن فقط گفتار یک گوینده وجود دارد، تقسیم می شود. در مرحله سوم با استفاده از خوشه بندی مناسب، بخش های گفتاری مرحله قبل، که متعلق به یک گوینده هستند، در یک خوشه جای می گیرند. جهت پیاده سازی سیستم از چهار نوع بردار ویژگی mfcc root-mfcc, tdc, و root-tdc و سه نوع پایگاه داده استفاده شده است و دقت مرحله بخش بندی 80% بوده است و دقت مرحله خوشه بندی نیز 59% با استفاده از ماشین بردار پشتیبان بدست آمده است
منابع مشابه
تایید گوینده با استفاده از ماشین های بردار پشتیبان
تعداد قابل توجهی از تحقیقات در استفاده از تکنیک های مدل های مخلوط گوسی (gmm) در سیستم های تایید گوینده مستقل از متن تمرکز دارد که جدیدترین عملکردها را ارائه می دهد. اخیرا استفاده از ماشین بردار پشتیبان (svm) در سیستم های تایید گوینده، منجر به عملکرد بهتری نسبت به روش استاندارد gmm شده است. svm یک طبقه بند تبعیضی است که نیاز به دو کلاس مثبت و منفی برای آموزش مدل گوینده دارد و بر اساس حداکثر حاشی...
15 صفحه اولبهبود روش های ماشین بردار پشتیبان در سیستم های هوشمند تشخیص گوینده مستقل از متن
سیستم تشخیص گوینده اتوماتیک یکی از سیستم های بیومتریک است که به دلایل امنیتی و کنترل تلفنی از راه دور در سالهای اخیر مورد توجه قرار گرفته است. روش های مختلفی برای بهبود کارایی این سیستم ها ارائه شده است. از آنجایی که این سیستم ها از ویژگی های با ابعاد بالا استفاده می کنند، بسیاری از این ویژگی ها اضافی و نامرتبطند و پیچیدگی این سیستم ها بالاست. یکی از روشهای بهبود کارایی این سیستم ها، حذف ویژگی ...
15 صفحه اولجهت یابی چند گوینده با استفاده از روش WCSSDOA
In this paper we propose the spatial sparsity based WCSSDOA method for multi speakers' Direction of arrival estimation. In the proposed method the sparse modeling is done based on the sensor signals' correlation matrix, which leads to low computational complexity. In this method the SVD decomposition of the noise covariance matrix is proposed to reach the free noise sparse model, which leads to...
متن کاملجهت یابی چند گوینده با استفاده از روش wcssdoa
در این مقاله، روش wcssdoa بر اساس مدلسازی تنک فضایی را برای جهتیابی چندگوینده پیشنهاد میدهیم. در روش wcssdoa ، به منظور کاهش حجم محاسبات، مدلسازی تنکی مساله بر اساس ماتریس همبستگی سیگنال حسگرها انجام میشود. در این روش، استفاده از تجزیه svd ماتریس کواریانس نویز، به منظور رسیدن به مدل تنک بدون نویز پیشنهاد میشود. رسیدن به مدل فوق باعث میشود روش پیشنهادی در snr های پایین دقت بیشتری نسبت به رو...
متن کاملتشخیص سهبعدی سرطان پستان با استفاده توأم از روشهای ماشین بردار پشتیبان و المان محدود
Background & Aims: Breast cancer is one of the most prevalent non-skin-related malignancies among women in the world. Thus, many countries have commenced screening test in early stages in order to diagnose breast cancer. Buried object detection is performed in the present work to detect 3-D breast cancer applying SVM classifier. Some transmitters and receivers are located above the breast. E...
متن کاملطراحی سامانۀ تشخیص تقلب با استفاده از ماشین بردار پشتیبان، انتخاب ویژگی و اعتبارسنجی متقابل
در سالهای اخیر پرداخت الکترونیکی، رشد سریعی در میان فعالیتهای اینترنتی داشته است؛ بهطوری که امروزه بهدلیل سرعت، کارایی، کاهش هزینهها و سهولت دسترسی، مشتریان زیادی را به خود جذب کرده است. کارتهای اعتباری یکی از پرکاربردترین ابزارهای پرداخت و مبادلات الکترونیکی هستند. در این پژوهش شناسایی و استخراج ویژگیهای تراکنشهای تقلبی در تشخیص تقلب و بهدنبال آن طبقهبندی صحیح آنها به دو طبقه قانو...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023